如今，Sora已经开始尝试建构真实世界了……

Original 尹哥聊基因尹哥聊基因 2024-03-30

点击上方蓝字关注“尹哥聊基因”

最近微信改版，容易找不到尹哥的文章，大家记得把尹哥设为星标⭐️ 哦~

在美国当地时间2024年2月15日，OpenAI发布了Sora。简单理解就是，可以直接通过人工智能，由文字或者语言直接生成的视频大模型。OpenAI官方并没有单纯地把它叫做视频模型，而是称为“世界模拟器”。也就是说从这一刻，可拟合更多真实物理定律的数字孪生世界走进了人类社会。我愿意将其类比为，开启了AI发展的牛顿时代。

1894年，当北洋水师输给了日本海军，清朝的覆灭几成定局，其主因固然是综合的战斗素质，但就主力舰艇的参数来讲，它主要输在了速度上。日本海军的主力战舰，吉野号的航速达到了23节，致远舰为18.5节，而定远、镇远二舰仅仅为15节左右。

1945年，日本最大，也是人类史上最大的一级战列舰大和号，这艘满载排水量超过了7万吨的怪兽，仅仅参战数次就被轰沉。美军的航空母舰，从空中对其进行了围剿，这是一种降维打击，它输在了Z轴的维度上，而大舰巨炮的战列舰时代从此也就结束了。

两年前我的确认为扎克伯格的“元宇宙”忽悠得太早太过了，但一年多前ChatGPT出台以后，我跟很多朋友们对话都认为，这一波AI的机遇是不容错过的，应当积极拥抱技术变化，加大开放交流。

而就在正月初七的这一天，OpenAI的Sora横空出世，以Photoshop等设计软件而闻名于世的Adobe公司可能做梦也没有想到，股价会是这样一个走势。确实，如果一句话就能生成视频，美工或者视频剪辑师的前途又在哪里？正如结束方便面的，是外卖或者预制菜，而不是更好的方便面。

△ Sora制作的视频之一

朋友们可以看看这些视频，在官网上都有。当我看着这一个个真假难辨的demo视频的时候，我更加清醒地明白了，我们遇到的不是一个周期，而是一个时代。周期还会回归，科技却只会呼啸而过，一个真正的、可以用真实物理定律孪生的数字世界，已经开始了它的时代。

为什么在ChatGPT3.5发布的时候，我们都觉得尚能一战呢？因为这个时候的竞争，主要依然是在语言和文本的一维层面，而Sora的到来，让我们看到了二维，乃至多维世界的模拟可能性。

虽然此时的Sora仍不完美，其依然是以二维为主的、真实世界模拟的展现。比如我们刚才看到的，这些以假乱真的视频，你仔细看，它里面都有很多的瑕疵。比如东京视频当中的左腿右腿的错误，就非常明显。但此时再去看看它的竞品，确实已经是一种石器时代的观感了。

推特上一位名叫Gabor Csellev的博主，给Sora、Pika、Runway和Stable Video四个模型，输入了相同的prompt，就是提示语，那么我简单地翻译一下，他输的提示语是，“美丽而繁华的东京正在下雪，这个镜头要穿过繁忙的城市街道，跟随着几个正在享受着美丽雪景，并且在附近购物的人们，而盛开的樱花花瓣随风起舞，落英缤纷”。

△ Gabor Csellev用Sora制作的视频

我们可以看一看，这四个软件不同的生成效果，虽然漫天飘雪和樱花盛开，在真实世界当中，几乎不会同时出现。但这组简单的效果对比，我们已经足以看到，Sora性能的遥遥领先。

就怕学霸还谦虚，OpenAI在其技术报告当中，毫不掩饰地承认了它的众多不足，Sora在很多方面还不能契合真实世界的物理特性，但这有什么关系呢，谁会要求一个幼儿刚学算术，就要求他会懂方程，重要的是，他已经做好了持续学习并应用微积分的准备。

正如牛顿时代的物理建构并不完美，爱因斯坦量子力学在不断地对其补充，但1687年牛顿的《自然哲学的数学原理》一经问世，人类的科学革命由此高潮迭起。在疫情前的那几年，人类遇到了科技瓶颈的说法，不绝于耳，似乎我们已经被“智子”锁死，然而就在这短短四年，无论是生命时空组学技术的突破、mRNA疫苗的突破、可控核聚变的突破、超导材料的突破、量子计算的突破，特别是人工智能的突破，让我们又一次看到了，人类文明快速演进的可能。

△ 利用时空组学技术开展的研究

在乐观之余，我们更要冷静地反观自身，这里面来自中国的原创贡献有多少？而在“脱钩断链”的不利大背景下，留给我们的机会和时间，真的足够吗？特朗普上台就开始打中美贸易战，打了几年发现伤敌一千、自损一千二，拜登虽然不断地被质疑身体健康有问题，尤其是脑健康问题，但不得不服气，他跟他的团队一出手就是王炸，直接打到了要害。

今天的芯片，不再仅仅只是一种电子元器件、一种商品，它是一种基础设施的提供者，如果把人类已经存在的语言、图像、音频、视频等这些资料库看成是人类文明的金矿，但是你已经有挖掘机了，我却被限制只能用铁锹，长此以往会是什么样的结果？

我们在芯片的问题上，可能犯了刻舟求剑的错误。比如总有一种声音，认为我们能够突破14纳米，甚至认为如果我们能追赶到7纳米，我们就会赢，但这个前提是我们的竞争对手就不进步了，就在原地等着。我并不是说，你追赶到14纳米、7纳米不重要，而是你要明白，竞争对手会在同样的时间，实现3纳米、2纳米，甚至1纳米。

我们可以在战略上藐视，但不能不在战术上重视，科技界、产业界、资本界，更不能揣着糊涂装明白，而我们在大模型的问题上，则可能陷入了一个概念炒作的资本套路。当下据不完全统计，国内号称有大模型的公司，已经有300多家，相信大部分还是“多小散乱”，面对GPT在简体中文的世界里，似乎尚能一战，但面对Sora的横空出世，可有一个能打的，甚至是接近的吗？

这就比如说在爬山，领先的一直在上面等你，好不容易气喘吁吁地快接近了，领先者再闲庭信步地，往上慢慢走一段，这就从心理上从体力上，不断地去消耗和打击你。

我讲这一段不是悲观，更不是长他人志气，灭自己威风，我是想说，知道落后不可怕，怕的是知道落后还不承认，那只会越拉越远。

1448年，当德国匠人古登堡发明了他的印刷术后，欧洲大量的书籍得以普及，学术思想交流加速，文学作品的范围扩大，文艺复兴开始加速，并逐渐催化出了科学革命。类似的，电报、广播、电视、互联网到移动互联网，大大加速了信息的对称，而人工智能则会以史无前例的速度，来促使人类的智力和知识平权。

在碳硅融合的重要关口，我们的科技，特别是我们的教育，又该何去何从？一味地做小镇做题家，还会有出路和未来吗？从李约瑟之问，到钱学森之问的尴尬，还要持续多久？这个问题就留给诸君共同考虑。

庄子在《齐物论》中云：“庄周梦为胡蝶，栩栩然胡蝶也，自喻适志与，不知周也……不知周之梦为胡蝶与，胡蝶之梦为周与？”刘慈欣《三体》当中，最著名的一句莫过于：“物理学不存在了。”Sora的问世，也让很多业内人士惊呼，“现实不存在了”。那么，不妨更大胆地想一步，如果我们已经可以模拟真实世界了，又焉知如今的真实世界，不是模拟的？

△ “我建构不出来的，我就不会理解。”——费曼

您觉得我们今天的世界是真实的吗？不妨留言讨论。

— END —

继续滑动看下一个

尹哥聊基因

向上滑动看下一个

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

女性最佳“绝经期”已公布，不是45岁，而是这个数，越接近越健康！

如今，Sora已经开始尝试建构真实世界了……

您可能也对以下帖子感兴趣

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

女性最佳“绝经期”已公布，不是45岁，而是这个数，越接近越健康！

生成图片，分享到微信朋友圈

如今，Sora已经开始尝试建构真实世界了……

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！